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OM nuclei' 
Run on: 



nucleic search, 
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13:06:56 ; Search time 760 Seconds 
(without alignments) 
55276.930 Million cell updates/sec 



Title: US-10-537-694-12 
Perfect score: 2297 

Sequence: 1 agagttggtttgtagtaact acttgcctgtttaatctcaa 2297 

Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 15574584 seqs, 9144637915 residues 

Total number of hits satisfying chosen parameters: 31149168 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



Post-processing: Min: 



Match 0% 
Match 100% 
Listing first 45 summaries 

N_Geneseq_200907 : * 
geneseqnl : * 
geneseqn2 : * 
geneseqn3 : * 
geneseqn4 : * 
geneseqn5 : * 
geneseqn6 : * 
geneseqn7 : * 
geneseqn8 : * 



Query 

Score Match Length DB 



2297 100.0 2297 
1968.2 85.7 3598 



ADP84413 
AAF85701 



Adp8 4 413 Human bre 
Aaf85701 Human can 



)://es/ScoreAccessWeb/GetItem.action?AppId=10537694cS:seqId=09323b6780c79aef&ItemN... 



11/20/2009 



SCORE Search Results Details for Application 10537694 and Search Result 2009091 1_1 15535_... Page 2 of 51 















ADL 1 2 8 4 4 


Adll2844 




4 


1965 ' 4 


85 ' 


' 6 


3787 


3 


ADR6 6 785 


Adr6 6 785 


Human 


5 


1965 ' 4 


85 


' 6 


3787 


3 


ADR6 58 82 


Adr6 5 882 


Human P ro 


g 


1954 


85 




3773 


7 


ARY6 14 42 


Ary6 14 42 


Psoriasis 


7 


1739 8 


75 


' 7 


2468 




AAH33714 


Aah33714 


Human^col 


g 


1738 ' 6 


75 


' 7 


3593 


3 


ADR66 784 


Adr6 6 78 4 


Human °ro 


g 


1738 ' 6 


75 


' 7 


3593 


3 


ADR6 5881 


Adr6 5 881 


Human 


10 


1736 ' 4 


75 


. 6 


3758 


7 


ARY781 19 


Ary78119 


Psoriasis 




1719 ' 8 


74 






8 


AWL 70912 


Awl70 912 


Human RBM 


12 


1541 ' 8 


67 




2261 




AAC 77930 


Aac77930 


Human can 


13 


1540 ' 4 


67 




2707 




AER33136 


Aer33136 


Human sec 
U 


14 


1539 ' 2 


67 








ABQ5 46 26 


Abqb 4 6 2 6 




15 


1539 ' 2 


67 




3507 




ARY 78127 


Ary 78 12 7 




16 


1539 ' 2 


67 




3655 




ADL458 75 


Adl 4 5 8 7 5 


Human^ova 


17 


1537 ' 6 


66 


' g 


2731 




AAF 98 7 02 


Aaf 98 7 02 


Human ova 


18 


1535 ' 2 


r?(? ' 


" 8 


1540 


7 


AU06 7863 


Auo6 7 863 


Human UTR 


19 


1329 ' 6 


y ,* 


' g 


1624 


1 


AAH 147 40 


Aahl 4 7 40 




20 


1329 . 6 


57 


, 9 


1624 




ABL87923 


Abl87923 


Human ova 


21 




41 ' 


. 3 


1608 


2 


ACN89924 


Acn89924 


Breast ca 




948*2 


41 








ARY 78123 


Ary 78 123 


Psoriasis 


23 


946 ' 8 


41 


2 


2751 


7 


ARY614 44 


Ary 6 14 4 4 


Psoriasis 


24 


935 ' 2 


40 


' 7 






AAA12412 


Aaal2412 


cDNA^enco 


25 


928 


40 


' 4 


1^0^ 


1 


ADL5 2 123 


Adl62123 


Human^va 


26 


779 


33 




-> i 4 o 


2 


ACCb01b2 


Acc50152 


Breast°ca 


27 


779 






2140 




ADL2 6 7 5 5 


Adl 2 6 755 




28 


779 


33 




2140 




AEG59925 


Aeg5 9 925 


H™ 3 ^ br 


29 


779 


33 




4280 


4 


AEL89335 


Ae 18 933 5 


Human can 


30 


773.2 


33 , 




2690 


7 


ARY78125 


Ary78125 


Psoriasis 








' 2 


2 "756 


4 


AED2 6 1 0 9 


Aed2 6 10 9 


N v 1 h m 


3 2 


736 ' 6 


32 


' x 






ABL8 7 9 2 2 


Abl87 922 


Human ova 


3 , 


690 ' 6 


30 


' 1 


765 




ADI 6 9 2 9 4 


Adi69294 


Human ova 


3 4 


690 ' 6 


30 


' 1 


765 




ADI 756 40 


Adi756 40 


Human ova 


*^b 


613*6 


26 


' 7 


1592 


g 


ARB7 8 5 4b 


Arb78545 


DNA^freTm 


36 


610 


26 


' 6 


640 




ADL 4 0 8 7 6 


Adl 40 8 76 


Human^va 


37 


581 2 


25 


" 3 


612 


5 


AER3 19 49 


Aer 3 1 949 


Human sec 


38 


557 


24 . 


. 2 


1503 


3 


AEW758 63 


Aew75863 


Bovine^ 0 




557 










AEW10917 


Aewl 0 917 


Bovine sp 


40 


538 


23 . 


, 4 


636 


1 


ADL43127 


Adl43127 


Human ova 


41 


530.8 


23. 


,1 


534 


1 


ABV96567 


Abv96 56 7 


Human pan 


42 


521 


22. 


. 7 


2457 


6 


ARC00831 


Arc00831 


DNA fragm 


43 


521 


22, 


.7 


2484 


7 


ARY78121 


Ary78121 


Psoriasis 


44 


517.2 


22. 


.5 


2624 


2 


ABT42551 


Abt42551 


Human nuc 


45 


511.6 


22. 


.3 


587 


1 


ADL41008 


Adl41008 


Human ova 



ALIGNMENTS 



RESULT 1 
ADP84413 

ID ADP84413 standard; DNA; 2297 BP. 
XX 

AC ADP84413; 

XX 

DT 09-SEP-2004 (first entry) 

XX 

DE Human breast-specific protein coding sequence #12. 

XX 

KW human; breast-specific protein; breast cancer; gene; ds . 

XX 

OS Homo sapiens . 
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xx 

PN WO2004053077-A2. 

XX 

PD 24-JUN-2004. 

XX 

PF 05-DEC-2003; 2003WO-US0388 1 5 . 
XX 

PR 05-DEC-2002; 200 2US-0 43 1 1 23P . 

XX 

PA (DIAD-) DIADEXUS INC. 

XX 

PI Macina RA, Turner LR, Sun Y, Chen H, Rodriguez M; 

XX 

DR WPI; 2004-468848/44. 

DR P-PSDB; ADP84514. 

XX 

PT New breast specific nucleic acid molecules and polypeptides useful for 

PT diagnosing, preventing or treating breast cancer, for producing 

PT transgenic animals or cells, or for research purposes. 

XX 

PS Claim 1; SEQ ID NO 12; 521pp; English. 

XX 

CC The invention comprises the amino acid and coding seguences of human 

CC breast-specific proteins. The DNA and protein seguences of the invention 

CC are useful for the diagnosis, treatment and prevention of breast cancer. 

CC The present DNA seguence encodes a human breast-specific protein of the 

CC invention. 

XX 

SQ Sequence 2297 BP; 713 A; 438 C; 431 G; 715 T; 0 U; 0 Other; 



Query Match 100.0%; Score 2297; DB 3; Length 2297; 

Best Local Similarity 100.0%; 

Matches 2297; Conservative 0; Mismatches 0; Indels 0; 



1 AGAG TTGGTTTG T AG T AAC T GGC AC TC AGG AAC AT GAG GGAAAAAAAT TACATATTGTGA 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1 AGAGTTGGTTTGTAGTAACTGGCACTCAGGAACATGAGGGAAAAAAAT TACATATTGTGA 60 



61 AATGGTTGAGAAGACATGAAAATCCACTTGATTTTGGTGTTTCCGAATTTCAGGCAAAGA 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 AATGGTTGAGAAGACATGAAAATCCACTTGATTTTGGTGTTTCCGAATTTCAGGCAAAGA 120 



Qy 121 ACTGTTTTTTAGGTTGACAGGGTGGAATTCAGATACTTCTATGCATTAACTGTATAATCA 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ACTGTTTTTTAGGTTGACAGGGTGGAATTCAGATACTTCTATGCATTAACTGTATAATCA 180 



181 AAAGGAAATTGCTTGGGATAGGATAAAGAACTGTGGTCTCTTTCTTTAAAATGTGTAGAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 AAAGGAAATTGCTTGGGATAGGATAAAGAACTGTGGTCTCTTTCTTTAAAATGTGTAGAT 240 



Qy 241 GGAACAGTGACTATGTTTTTAGTGCTAGCACGTGCATGTCAGCTGTTACAAATATGTCTC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GGAACAGTGACTATGTTTTTAGTGCTAGCACGTGCATGTCAGCTGTTACAAATATGTCTC 300 



Qy 301 AAAGAATCTCTCTTTGCATATCTAGGCCTGTCTCCTCCCTCCTACACATTTCCAGCTCCT 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AAAGAATCTCTCTTTGCATATCTAGGCCTGTCTCCTCCCTCCTACACATTTCCAGCTCCT 360 



Qy 361 GCTGCAGTTATTCCTACAGAAGCTGCCATTTACCAGCCCTCTGTGATTTTGAATCCACGA 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GCTGCAGTTATTCCTACAGAAGCTGCCATTTACCAGCCCTCTGTGATTTTGAATCCACGA 420 
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421 GCACTGCAGCCCTCCACAGCGTACTACCCAGCAGGCACTCAGCTCTTCAT GAACTACACA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 GCACTGCAGCCCTCCACAGCGTACTACCCAGCAGGCACTCAGCTCTTCAT GAACTACACA 480 

481 GCGTACTATCCCAGCCCCCCAGGTTCGCCTAATAGTCTTGGCTACTTCCCTACAGCTGCT 5 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 GCGTACTATCCCAGCCCCCCAGGTTCGCCTAATAGTCTTGGCTACTTCCCTACAGCTGCT 5 40 

5 41 AATCTTAGCGGTGTCCCTCCACAGCCTGGCACGGTGGTCAGAATGCAGGGCCTGGCCTAC 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5 41 AATCTTAGCGGTGTCCCTCCACAGCCTGGCACGGTGGTCAGAATGCAGGGCCTGGCCTAC 6 00 

601 AATACTGGAGTTAAGGAAATTCTTAACTTCTTCCAAGGTTACCAGTATGCAACCGAGGAT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 AATACTGGAGTTAAGGAAATTCTTAACTTCTTCCAAGGTTACCAGTATGCAACCGAGGAT 660 

661 GGACTTATACACACAAATGACCAGGCCAGGACTCTACCCAAAGAATGGGTTTGTATTTAA 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 GGACTTATACACACAAATGACCAGGCCAGGACTCTACCCAAAGAATGGGTTTGTATTTAA 720 

721 GGGCCCCAGCAGTTAGAACATCCTCAGAAAAGAAGTGTTTGAAAGATGTATGGTGATCTT 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 GGGCCCCAGCAGTTAGAACATCCTCAGAAAAGAAGTGTTTGAAAGATGTATGGTGATCTT 780 

781 GAAAC C T C C AGAC AC AAGAAAAC T T C T AGC AAAT TC AGGGGAAGT T T G T C T AC AC T C AG G 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 GAAAC C T CC AGAC AC AAGAAAAC T T C T AGC AAAT TCAGGGGAAG TTTGTCTACACT C AG G 840 

841 CTGCAGTATTTTCAGCAAACTTGATTGGACAAACGGGCCTGTGCCTTATCTTTTGGTGGA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 CTGCAGTATTTTCAGCAAACTTGATTGGACAAACGGGCCTGTGCCTTATCTTTTGGTGGA 900 

901 GTGAAAAAATTTGAGCTAGTGAAGCCAAATCGTAACTTACAGCAAGCAGCATGCAGCATA 96 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 GTGAAAAAATTTGAGCTAGTGAAGCCAAATCGTAACTTACAGCAAGCAGCATGCAGCATA 96 0 

961 CCTGGCTCTTTGCTGATTGCAAATAGGCATTTAAAATGTGAATTTGGAATCAGATGTCTC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 CCTGGCTCTTTGCTGATTGCAAATAGGCATTTAAAATGTGAATTTGGAATCAGATGTCTC 1020 

1021 CATTACTTCCAGTTAAAGTGGCATCATAGGTGTTTCCTAAGTTTTAAGTCTTGGATAAAA 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 CATTACTTCCAGTTAAAGTGGCATCATAGGTGTTTCCTAAGTTTTAAGTCTTGGATAAAA 108 0 

1081 ACTCCACCAGTGTCTACCATCTCCACCATGAACTCTGTTAAGGAAGCTTCATTTTTGTAT 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 ACTCCACCAGTGTCTACCATCTCCACCATGAACTCTGTTAAGGAAGCTTCATTTTTGTAT 114 0 

1141 ATTCCCGCTCTTTTCTCTTCATTTCCCTGTCTTCTGCATAATCATGCCTTCTTGCTAAGT 120 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 ATTCCCGCTCTTTTCTCTTCATTTCCCTGTCTTCTGCATAATCATGCCTTCTTGCTAAGT 120 0 

1201 AAT T C AAGC AT AAGAT C T T GGAAT AATAAAATC ACAAT C T T AGGAG AAAG AAT AAAAT T G 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 AAT T C AAGC AT AAGAT C T T GGAAT AATAAAATC ACAAT C T T AGGAG AAAG AAT AAAAT T G 1260 

1261 TTATTTTCCCAGTCTCTTGGCCATGATGATATCTTATGATTAAAAACAAATTAAATTTTA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 TTATTTTCCCAGTCTCTTGGCCATGATGATATCTTATGATTAAAAACAAATTAAATTTTA 1320 
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1321 AAACACCTGAAGATATATTAGAAGAAATTGTGCACCCTCCACAAAACATACAAAGTTTAA 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 AAACACCTGAAGATATATTAGAAGAAATTGTGCACCCTCCACAAAACATACAAAGTTTAA 1380 

1381 AAGTTTGGATCTTTTTCTCAGCAGGTATCAGTTGTAAATAATGAATTAGGGGCCAAAATG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 AAGTTTGGATCTTTTTCTCAGCAGGTATCAGTTGTAAATAATGAATTAGGGGCCAAAATG 1440 

1441 CAAAACGAAAAATGAAGCAGCTACATGTAGTTAGTAATTTCTAGTTTGAACTGTAATTGA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 CAAAACGAAAAATGAAGCAGCTACATGTAGTTAGTAATTTCTAGTTTGAACTGTAATTGA 1500 

1501 ATATTGTGGCTTCATATGTATTATTTTATATTGTACTTTTTTCATTATTGATGGTTTGGA 156 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 ATATTGTGGCTTCATATGTATTATTTTATATTGTACTTTTTTCATTATTGATGGTTTGGA 156 0 

1561 CTTTAATAAGAGAAATTCCATAGTTTTTAATATCCCAGAAGTGAGACAATTTGAACAGTG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 C T T T AAT AAGAG AAAT T C C ATAG T T T T TAAT ATC CC AG AAG T GAGAC AAT T T GAAC AG T G 1620 

1621 TATTCTAGAAAACAATACACTAACTGAACAGAAGTGAATGCTTATATATATTATGATAGC 1680 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 TATTCTAGAAAACAATACACTAACTGAACAGAAGTGAATGCTTATATATATTATGATAGC 1680 

1681 CTTAAACCTTTTTCCTCTAATGCCTTAACTGTCAAATAATTATAACCTTTTAAAGCATAG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 CTTAAACCTTTTTCCTCTAATGCCTTAACTGTCAAATAATTATAACCTTTTAAAGCATAG 1740 

17 41 GACTATAGTCAGCATGCTAGACTGAGAGGTAAACACTGATGCAATTAGAACAGGTACTGA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
17 41 GACTATAGTCAGCATGCTAGACTGAGAGGTAAACACTGATGCAATTAGAACAGGTACTGA 1800 

1801 TGCTGTCAGTGTTTAACACTATGTTTAGCTGTGTTTATGCTATAAAAGTGCAATATTAGA 186 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 TGCTGTCAGTGTTTAACACTATGTTTAGCTGTGTTTATGCTATAAAAGTGCAATATTAGA 186 0 

1861 CACTAGCTAGTACTGCTGCCTCATGTAACTCCAAAGAAAACAGGATTTCATTAAGTGCAT 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 CACTAGCTAGTACTGCTGCCTCATGTAACTCCAAAGAAAACAGGATTTCATTAAGTGCAT 192 0 

1921 TGAATGTGGCTATTTCTCTAAGTTACTCATATTGTCCTTTGCTTGAATGCAATGCCGTGC 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TGAATGTGGCTATTTCTCTAAGTTACTCATATTGTCCTTTGCTTGAATGCAATGCCGTGC 198 0 

1981 AGATTTATGTGGCTGCTATTTTTATTTTCTGTGCATTACTTTAACACCTTAAAGGGAGAA 20 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 AGATTTATGTGGCTGCTATTTTTATTTTCTGTGCATTACTTTAACACCTTAAAGGGAGAA 20 4 0 

2041 GCAAACATTTCCTTCTTCAGCTGACTGGCAATGGCCCTTTAACTGCAATAGGAAGAAAAA 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 GCAAACATTTCCTTCTTCAGCTGACTGGCAATGGCCCTTTAACTGCAATAGGAAGAAAAA 2100 

2101 AAAAAAGGTTTGTGTGAAAATTGGTGATAACTGGCACTTAAGATCGAAAAGAAATTTCTG 216 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 AAAAAAGGTTTGTGTGAAAATTGGTGATAACTGGCACTTAAGATCGAAAAGAAATTTCTG 216 0 

2161 TATACTTGATGCCTTAAGATGCCCAAAGCTGCCCAAAGCTCTGAAAGACTTTAAGATAGG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 TATACTTGATGCCTTAAGATGCCCAAAGCTGCCCAAAGCTCTGAAAGACTTTAAGATAGG 2220 

2221 CAGTAATGCTTACTACAATACTACTGAGTTTTTGTAGAGTTAACATTTGATAATAAAACT 228 0 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2221 CAGTAATGCTTACTACAATACTACTGAGTTTTTGTAGAGTTAACATTTGATAATAAAACT 228 0 

2281 TGCCTGTTTAATCTCAA 2297 

I I I I I I I I I I I I I I I I I 
2281 TGCCTGTTTAATCTCAA 2297 



RESULT 2 
AAF85701 

ID AAF85701 standard; cDNA; 3598 BP. 
XX 

AC AAF85701; 

XX 

DT 10-DEC-2001 (first entry) 

XX 

DE Human cancer related protein 20P2H8 coding sequence. 

XX 

KW Human; cancer related protein 20P2H8; vaccine; chromosome 15q32-23; 

KW prostate cancer; bladder cancer; colon cancer; pancreatic cancer; ss. 

XX 

OS Homo sapiens. 



XX 

FH Key Location/Qualifiers 

FT CDS 1. .2148 

FT /*tag= a 

FT /product= "20P2H8 alternative version" 

FT CDS 451. .2004 

FT /*tag= b 

FT /product= "20P2H8" 

XX 



PN WO200131012-A1 . 
XX 

PD 03-MAY-2001. 

XX 

PF 26-OCT-2000; 200 0WO-US029 4 7 7 . 
XX 

PR 28-OCT-1999; 9 9US-0 1 6 236 4P . 
XX 

PA (UROG-) UROGENESYS INC. 
XX 

PI Afar DEH, Raitano AB, Hubert RS, Mitchell SC, Jakobovits A; 

XX 

DR WPI; 2001-308645/32. 

DR P-PSDB; AAB81201, AAB60948. 

XX 

PT 20P2H8 polynucleotides and polypeptides useful for diagnosing and 

PT treating cancer, and for screening for screening for modulating 

PT compounds . 

XX 

PS Claim 1; Fig 1; lllpp; English. 

XX 

CC The present invention provides the protein and coding sequences of human 

CC cancer related protein 20P2H8. The gene, which is found at chromosome 

CC 15q32-23, is upregulated in cancers such as that of the prostate, 

CC bladder, colon and pancreas. The sequences can be used to diagnose and 

CC treat these cancers, and to vaccinate against them. The present sequence 

CC is the coding sequence of the invention 

XX 

SQ Sequence 3598 BP; 1072 A; 741 C; 763 G; 1022 T; 0 U; 0 Other; 
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Query Match 85.7%; Score 1968.2; DB 1; Length 3598; 

Best Local Similarity 99.6%; 

Matches 1973; Conservative 0; Mismatches 8; Indels 0; Gaps 0; 

>y 317 CATATCTAGGCCTGTCTCCTCCCTCCTACACATTTCCAGCTCCTGCTGCAGTTATTCCTA 376 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ib 1601 CACCGCCATGCCTGTCTCCTCCCTCCTACACATTTCCAGCTCCTGCTGCAGTTATTCCTA 166 0 

iy 377 CAGAAGCTGCCATTTACCAGCCCTCTGTGATTTTGAATCCAC GAGCACTGCAGCCCTCCA 436 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
•b 1661 CAGAAGCTGCCATTTACCAGCCCTCTGTGATTTTGAATCCACGAGCACTGCAGCCCTCCA 1720 

y 437 CAGCGTACTACCCAGCAGGCACTCAGCTCTTCATGAACTACACAGCGTACTATCCCAGCC 496 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
>b 1721 CAGCGTACTACCCAGCAGGCACTCAGCTCTTCATGAACTACACAGCGTACTATCCCAGCC 1780 

y 497 CCCCAGGTTCGCCTAATAGTCTTGGCTACTTCCCTACAGCTGCTAATCTTAGCGGTGTCC 556 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 1781 CCCCAGGTTCGCCTAATAGTCTTGGCTACTTCCCTACAGCTGCTAATCTTAGCGGTGTCC 1840 

y 557 CTCCACAGCCTGGCACGGTGGTCAGAATGCAGGGCCTGGCCTACAATACTGGAGTTAAGG 616 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
<b 1841 CTCCACAGCCTGGCACGGTGGTCAGAATGCAGGGCCTGGCCTACAATACTGGAGTTAAGG 1900 

y 617 AAATTCTTAACTTCTTCCAAGGTTACCAGTATGCAACCGAGGATGGACTTATACACACAA 6 76 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
>b 1901 AAATTCTTAACTTCTTCCAAGGTTACCAGTATGCAACCGAGGATGGACTTATACACACAA 196 0 

y 677 ATGACCAGGCCAGGACTCTACCCAAAGAATGGGTTTGTATTTAAGGGCCCCAGCAGTTAG 736 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 1961 ATGACCAGGCCAGGACTCTACCCAAAGAATGGGTTTGTATTTAAGGGCCCCAGCAGTTAG 202 0 

y 737 AACATCCTCAGAAAAGAAGTGTTTGAAAGATGTATGGTGATCTTGAAACCTCCAGACACA 796 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
>b 2021 AACATCCTCAGAAAAGAAGTGTTTGAAAGATGTATGGTGATCTTGAAACC TCCAGACACA 2080 

y 797 AGAAAACTTCTAGCAAATTCAGGGGAAGTTTGTCTACACTCAGGCTGCAGTATTTTCAGC 856 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 2081 AGAAAACTTCTAGCAAATTCAGGGGAAGTTTGTCTACACTCAGGCTGCAGTATTTTCAGC 2140 

y 857 AAACTTGATTGGACAAACGGGCCTGTGCCTTATCTTTTGGTGGAGTGAAAAAATTTGAGC 916 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 2141 AAACTTGATTGGACAAACGGGCCTGTGCCTTATCTTTTGGTGGAGTGAAAAAATTTGAGC 2200 

y 917 TAGTGAAGCCAAATCGTAACTTACAGCAAGCAGCATGCAGCATACCTGGCTCTTTGCTGA 976 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 2201 TAGTGAAGCCAAATCGTAACTTACAGCAAGCAGCATGCAGCATACCTGGCTCTTTGCTGA 2260 

y 977 TTGCAAATAGGCATTTAAAATGTGAATTTGGAATCAGATGTCTCCATTACTTCCAGTTAA 103 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
<b 2261 TTGCAAATAGGCATTTAAAATGTGAATTTGGAATCAGATGTCTCCATTACTTCCAGTTAA 2320 

y 1037 AGTGGCATCATAGGTGTTTCCTAAGTTTTAAGTCTTGGATAAAAACTCCACCAGTGTCTA 1096 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ib 2321 AGTGGCATCATAGGTGTTTCCTAAGTTTTAAGTCTTGGATAAAAACTCCACCAGTGTCTA 2380 

iy 1097 CCATCTCCACCATGAACTCTGTTAAGGAAGCTTCATTTTTGTATATTCCCGCTCTTTTCT 1156 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ib 2381 CCATCTCCACCATGAACTCTGTTAAGGAAGCTTCATTTTTGTATATTCCCGCTCTTTTCT 2440 

iy 1157 CTTCATTTCCCTGTCTTCTGCATAATCATGCCTTCTTGCTAAGTAATTCAAGCATAAGAT 1216 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 4 41 CTTCATTTCCCTGTCTTCTGCATAATCATGCCTTCTTGCTAAGTAATTCAAGCATAAGAT 250 0 

1217 C T T GG AAT AAT AAAAT C AC AAT C T T AGGAG AAAG AAT AAAAT TGTTATTTTCCCAGTCTC 1276 

2501 C T T GG AAT AAT AAAAT C AC AATC T T AGGAG AAAGAAT AAAAT TGTTATTTTCCCAGTCTC 2560 

1277 TTGGCCATGATGATATCTTATGATTAAAAACAAATTAAATTTTAAAACACCTGAAGATAT 1336 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2561 TTGGCCATGATGATATCTTATGATTAAAAACAAATTAAATTTTAAAACACCTGAAGATAA 2620 

1337 AT T AG AAG AAAT T G T G C AC C C T C C AC AAAAC AT AC AAAGT T T AAAAG T T T GGAT C T T T T T 1396 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2621 ATTAGAAGAAATTGTGCACCCTCCACAAAACATACAAAGTTTAAAAGTTTGGATCTTTTT 2680 

1397 CTCAGCAGGTATCAGTTGTAAATAATGAAT TAGGGGCCAAAATGCAAAAC GAAAAATGAA 1456 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2681 CTCAGCAGGTATCAGTTGTAAATAATGAAT TAGGGGCCAAAATGCAAAAC GAAAAATGAA 2740 

145 7 GCAGCTACATGTAGTTAGTAATTTCTAGTTTGAACTGTAATTGAATATTGTGGCTTCATA 1516 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 7 41 GCAGCTACATGTAGTTAGTAATTTCTAGTTTGAACTGTAATTGAATATTGTGGCTTCATA 280 0 

1517 TGTATTATTTTATATTGTACTTTTTTCATTATTGATGGTTTGGACTTTAATAAGAGAAAT 15 7 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2801 TGTATTATTTTATATTGTACTTTTTTCATTATTGATGGTTTGGACTTTAATAAGAGAAAT 286 0 

1577 TCCATAGTTTTTAATATCCCAGAAGTGAGACAATTTGAACAGTGTATTCTAGAAAACAAT 1636 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2861 TCCATAGTTTTTAATATCCCAGAAGTGAGACAATTTGAACAGTGTATTCTAGAAAACAAT 292 0 

1637 AC AC T AAC T G AAC AG AAGTG AATGC T TAT AT AT AT TAT GAT AGCC T TAAAC CTTTTTCCT 1696 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2921 ACACTAACT G AAC AGAAGTG AATGC T TAT AT AT AT TAT GAT AGCC T TAAAC CTTTTTCCT 2980 

1697 CTAATGCCTTAACTGTCAAATAATTATAACCTTTTAAAGCATAGGACTATAGTCAGCATG 175 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2981 CTAATGCCTTAACTGTCAAATAATTATAACCTTTTAAAGCATAGGACTATAGTCAGCATG 3040 

175 7 C T AGAC T GAGAG G TAAAC AC T GATGC AAT T AGAAC AGG T AC T GAT G C T G T C AG T G T T T AA 1816 

30 41 C T AGAC T GAGAG G TAAAC AC TGATGC AAT T AGAAC AGG T AC T GAT G C T G T C AG T G T T T AA 310 0 

1817 CACTATGTTTAGCTGTGTTTATGCTATAAAAGTGCAATATTAGACACTAGCTAGTACTGC 18 7 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3101 CACTATGTTTAGCTGTGTTTATGCTATAAAAGTGCAATATTAGACACTAGCTAGTACTGC 316 0 

1877 TGCCTCATGTAACTCCAAAGAAAACAGGATTTCATTAAGTGCATTGAATGTGGCTATTTC 193 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3161 TGCCTCATGTAACTCCAAAGAAAACAGGATTTCATTAAGTGCATTGAATGTGGATATTTC 322 0 

193 7 TCTAAGTTACTCATATTGTCCTTTGCTTGAATGCAATGCCGTGCAGATTTATGTGGCTGC 199 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3221 TCTAAGTTACTCATATTGTCCTTTGCTTGAATGCAATGCCGTGCAGATTTATGAGGCTGC 328 0 

199 7 TATTTTTATTTTCTGTGCATTACTTTAACACCTTAAAGGGAGAAGCAAACATTTCCTTCT 205 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3281 TATTTTTATTTTCTGTGCAT TACTTTAACACCTTAAAGGGAGAAGCAAACATTTCCTTCT 33 4 0 

205 7 TCAGCTGACTGGCAATGGCCCTTTAACTGCAATAGGAAGAAAAAAAAAAAGGTTTGTGTG 2116 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 



3341 TCAGCTGACTGGCAATGGCCCTTTAACTGCAATAGGAAGAAAAAAAAAAAGGTTTGTGTG 3400 



Qy 




Db 



Qy 



2177 AGATGCCCAAAGCTGCCCAAAGCTCTGAAAGACTTTAAGATAGGCAGTAATGCTTACTAC 2236 




Db 



3 461 AGATGCCCAAAGCTGCCCAAAGCTCTGAAAGACTTTAAGATAGGCAGTAATGCTTACTAC 352 0 



Db 



Qy 




Qy 



2297 A 2297 



Db 



3581 A 3581 



RESULT 3 
ADL12844 

ID ADL12844 standard; cDNA; 3940 BP. 
XX 

AC ADL12844; 

XX 

DT 06-MAY-2004 (first entry) 
XX 

DE Human steroid-induced C3A liver cell cDNA #573. 
XX 

KW ss; gene; Hepatotropic; Gene therapy; Wilson disease; liver disorder; 

KW steroid therapy; cirrhosis; hepatitis; human; C3A liver cell. 

XX 

OS Homo sapiens. 
XX 

PN US6673549-B1 . 
XX 

PD 06-JAN-2004. 

XX 

PF 12-OCT-2001; 200 1US-00 9 76 5 9 4 . 

XX 

PR 12-OCT-2000; 200 OUS-02 40 40 9P . 
XX 

PA (INCY-) INCYTE CORP. 

XX 

PI Furness LM, Buchbinder JL; 

XX 

DR WPI; 2004-068610/07. 

XX 

PT Combination useful for preparing a composition for treating liver 

PT disorders associated with steroid therapy, e.g., cirrhosis or hepatitis, 

PT comprises cDNAs that are differentially expressed in response to steroid 

PT treatment. 

XX 

PS Claim 1; SEQ ID NO 573; 141pp; English. 

XX 

CC The invention relates to a combination comprising cDNAs that are 

CC differentially expressed in response to steroid treatment. Also included 

CC are the following: a high throughput method for using a cDNA to detect 

CC differential expression of nucleic acids in a sample; and a high 

CC throughput method of screening molecules or compounds to identify a 

CC ligand that specifically binds a cDNA. The sample is from a subject with 
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